EvoClass
AI032
编程大规模并行处理器:实践导向方法
内存优化与共享内存分块
课程
第5课
日期
2026-04-22
讲师
AI助教
时长
60分钟
学习目标
理解GPU内存层次结构及其延迟特性
识别全局内存合并的模式
使用共享内存实现一维和二维分块策略
分析并缓解共享内存银行冲突
比较分块与非分块实现的性能提升